# -*- coding:utf-8 -*-
"""
Author：Administrator
Date:2022年01月13日
"""
import requests
from lxml import etree
import os
import time
import re

if not os.path.exists('./财务资料'):
	os.mkdir('./财务资料')

url = "https://www.jkl.com.cn/newsList.aspx?TypeId=10009"
headers = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.36"}

响应数据= requests.get(url=url,headers=headers).text
解析 = etree.HTML(响应数据)
项目名称=解析.xpath('//div[@class="infoLis"]//a/text()')
项目链接=解析.xpath('//div[@class="infoLis"]//@href')

项目链接 = ['http://www/jkl.com.cn/'+项目链接 for 项目链接 in 项目链接]
字典1 = dict(zip(项目名称,项目链接))
for 项目名称,项目链接 in 字典1.items():
	项目名称=项目名称.replace('/','_')
	项目名称=项目名称.replace('...','报表')
	路径 = './'+项目名称
	if not os.path.exists(路径):
		os.mkdir(路径)
	响应数据 = requests.get(url=项目链接,headers=headers).text
	解析= etree.HTML(响应数据)
	尾页=解析.xpath('//a[text()=尾页]/@href')
	print(尾页)
	



# if 尾页 !=[]:
# 	正则=re.search("current=(\d+)",尾页[0])
# 	页数=正则.group(1)
# else:
# 	页数=1
# print(页数)




